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INTRODUCCIÓN 

El análisis estadístico, es fundamental para el desarrollo de actividades de 
estimación de fundamentos botánicos y genéticos, así pues, este nos permite 
determinar que toda variable cuantitativa y cualitativa determina la propiedad y 
autenticidad de ciertas especies y su carácter de pertenencia genética. 

Por su parte la caracterización morfológica de recursos fitogenéticos es la 
determinación de un conjunto de caracteres mediante el uso de descriptores 
definidos que permiten diferenciar taxonómicamente a las plantas. Algunos 
caracteres pueden ser altamente heredables, fácilmente observables y expresables 
en la misma forma en cualquier ambiente. Las características morfológicas se 
utilizan para estudiar la variabilidad genética, para identificar plantas y para 
conservar los recursos genéticos. Por lo tanto, la caracterización es el primer paso 
en el mejoramiento de los cultivos y programas de conservación, esto acompañado 
de distintos métodos estadísticos y análisis respectivos. 

En el siguiente bloque o archivo, mostramos parte didáctica del uso y manejo de 
análisis estadísticos y caracterización morfológica 



1. OBJETIVOS 

- Realizar un análisis estadístico de una variable cuantitativa de Salvia 
leucantha. 

- Caracterizar morfológicamente 5 especies (5 géneros) de la familia 
Lamiaceae. 

- Realizar un dendrograma de la familia Lamiacea (5 géneros). 

2. MARCO TEORICO 

2.1. Origen y distribución de Salvia leucantha 

Salvia leucantha es una planta de origen mexicano, introducida y asilvestrada en 
algunas zonas de las Islas Canarias asi misma tiene una amplia distribución por 
américa del sur como argentina, Colombia, Brasil, Ecuador y Perú. Se diferencia 
claramente de otras especies del género por sus flores lanudas de color blanco. 

El género Salvia es el principal dentro de la familia Lamiaceae, de la cual se tienen 
registrados 224 géneros y 5600 especies. Salvia se encuentra ampliamente 
distribuida a nivel mundial, incluyendo cerca de 1000 especies. Para su estudio se 
divide en cuatro subgéneros: Salvia, Leonia, Sclarea y Calosphace. La diversidad 
de especies de Salvia que existe en México es una de las más amplias. Para el caso 
de las representantes mexicanas estas se clasifican dentro del subgénero 
Calosphace; a excepción de 3 especies distribuidas en el noroeste de México las 
cuales pertenecen al subgénero Leonina y 12 más de Baja California. Actualmente 
se conocen aproximadamente 300 especies para todo México, 88% de ellas 
endémicas. Las especies de Salvias se han adaptado desarrollándose en diversos 
tipos de vegetación como lo son: zonas áridas, desérticas, bosques tropicales, 
caducifolios y sub-caducifolios, muestran preferencia por los bosques de clima 
templado que se desarrollan en altitudes superiores a ios 1000 msnm, la mayor 
parte de las especies están entre los 1500 y 2500 m.s.n.m. El termino Salvia 
proviene del latín “salvare”, que significa curar, esto en referencia a sus propiedades 
curativas de varias especies. Salvia (tribu Mentheae) es el género más diverso de 
la familia Lamiaceae, con cerca de 1000 especies distribuidas alrededor del mundo. 
En Centro y Sudamérica está representado por cerca de 500 especies. México es 



considerado como una de las áreas con mayor diversidad del género en el mundo, 
con aproximadamente 300 especies, que en un porcentaje importante (85-88%) 
son endémicas. Villaseñor (2004) indica que Salvia es el segundo género más 
diverso en la República Mexicana (292 especies), superado marginalmente por 
Mammillaria (Cactaceae), que tiene 306. 

La mayor diversidad de especies del género Salvia se presenta en las zonas 
montañosas de México, principalmente en las del centro-sur del país (Espejo y 
Ramamoorthy, 1993). En consecuencia, los bosques templados y en particular los 
de coniferas y encinares, son los tipos de vegetación que albergan la mayor 
proporción de especies de Salvia. 

Aunque Fernald (1900) fue el primero en hacer un compendio de las salvias 
mexicanas y centroamericanas, la obra clásica que ofrece una revisión completa del 
subgénero Calosphace, es la de Epling (1939), en la cual se citan 229 especies para 
México, agrupadas en 52 secciones. Estudios complementarios que describen 
nuevas especies o que incluyen. 

A pesar de la sobresaliente diversidad de Salvia, son pocos los estudios que ofrecen 
información monográfica actualizada de sus especies, como el de Espejo y 
Ramamoorthy (1993), quienes hacen una revisión de la sección Sigmoideae y 
aportan información detallada de 11 especies, todas endémicas de México. 

2.2. Descripción y taxonomía 

2.2.1. Variable cuantitativa 

- Mide hasta 1.20 metros de altura. 

- Las hojas son largas, de hasta 15 cm por 18 mm. 

- Fruto pequeño de 2-3 mm. 

- Tamaño promedio de la inflorescencia de hasta 20 cm. 

- Hasta 23 conjuntos de flores. 

2.2.2. Variable cualitativa 

- Son arbustos aromáticos perennifolios 



- Flores de forma tubular 

- Cálices lanudos 

- Inflorescencia cima color blanco-violáceo 

- Ápice de la hoja acuminado 

- Nerviación de la hoja evidente 

- Hoja de apariencia aterciopelada 

- Hoja color verde oscuro grisáceo 

2.2.3. Taxonomía 

Reino: Plantae 
División: Tracheophyta 
Clase: Magnoliopsida 
Orden: Lamíales 
Familia: Lamiaceae 
Subfamilia: Nepetoideae 
Tribu: Mentheae 
Género: Salvia 

Especie; Salvia leucantha Cav. 

2.3. Caracterización morfológica 

Se llaman marcadores morfológicos a las características fenotípicas de fácil 
identificación visual tales como forma, color, tamaño o altura. Muchos de ellos se 
convierten en importantes (descriptores), a la hora de inscribir nuevas variedades. 

Este tipo de marcadores contribuyó significativamente al desarrollo teórico del 
ligamiento genético y a la construcción de las primeras versiones de mapas 
genéticos.1 Las características morfológicas controladas por un solo locus pueden 
ser usadas como un marcador genético si su expresión es reproducible en un amplio 
rango de ambientes. Aunque los marcadores morfológicos son codominantes y han 
sido útiles para predecir la respuesta genética a seleccionar, ellos pueden ser 



influenciados por el medio ambiente y por factores genéticos, como la epistasis. Por 
tal motivo, la descripción de tal característica sólo tiene sentido cuando está 
acompañada de una información apropiadamente documentada y condiciones 
ambientales controladas. 

2.4. Caracterización 

En la caracterización de una especie se estima la variabilidad existente en el 
genoma de la población de individuos que la conforman. Así, el genoma de las 
especies de animales o plantas contiene toda la información codificada en forma de 
genes que se necesitan tanto para establecer su identidad morfológica como para 
desarrollar todos los procesos y funciones vitales para su supervivencia. Se estima 
que las plantas superiores poseen un poco más de 400,000 genes con funciones 
particulares dentro de la especie y un buen número de ellos ha creado variantes por 
efectos evolutivos y del medio ambiente. Esas variantes se van acumulando entre 
los diferentes miembros componentes de la especie y la suma de todos los efectos 
de los genes y sus variantes es lo que se denomina variabilidad genética de una 
especie. 

Todos los genes cumplen determinadas funciones y sus efectos pueden o no 
expresarse en características identificadles de forma visual. Esto quiere decir que 
hay una variabilidad que se puede detectar a simple vista y otra que, aunque no es 
visible fácilmente, también existe en la especie pero que requiere de técnicas 
especiales para ser detectada. Por ello, es primordial identificar cuál es el nivel de 
variabilidad que se intenta medir o describir con el fin de elegir las herramientas o 
métodos estadísticos adecuados para analizar los datos resultantes de un estudio 
de caracterización. 

El primer nivel se refiere a la caracterización de la variabilidad detectable 
visualmente, la cual se puede dividir en los tipos siguientes: 

- Las características responsables de la morfología y la arquitectura de la 
planta utilizadas en un principio para la clasificación botánica y taxonómica, 
aunque en muchas de ellas se pueden encontrar variantes. 



- Una serie de características relacionadas especialmente con aspectos de 
manejo agronómico y de producción de la especie que son de interés para 
mejoradores y agrónomos. En la mayoría de los bancos de germoplasma de 
programas existentes actualmente se hace una caracterización morfo 
agronómica en la que se fusionan estos dos primeros tipos. 

- Un grupo de características detectables visualmente que sólo se expresan 
como reacción a estímulos del medio ambiente. Estos pueden ser biótico 
como plagas y enfermedades; o abióticos como sequías, deficiencias de 
minerales y cambios en temperatura, entre otros. Este tipo de caracterización 
se denomina evaluación y para su correcta cuantificación, generalmente, se 
requieren diseños experimentales separados de la caracterización morfo 
agronómica. 

El segundo nivel se refiere a la caracterización de la variabilidad que no es 
detectable por simple observación visual. Esta caracterización se denomina 
molecular porque se refiere a la identificación de productos y/o funciones internas 
de la célula. Todas las técnicas de laboratorio para detectar esta variabilidad se 
agrupan dentro del concepto de marcadores moleculares explicado anteriormente. 
Si bien ya existen algunos métodos de análisis de datos en proceso de desarrollo 
para estos tipos de caracterización las técnicas de laboratorio son relativamente 
recientes y están en continuo proceso de mejoramiento. 

2.5. Accesión 

Se denomina así a la muestra viva de una planta, cepa o población mantenida en 
un Banco de Germoplasma para su conservación y uso. Una especie puede estar 
representada por varias accesiones que se diferencian por el tipo de población al 
que pertenecen (variedad primitiva, variedad tradicional, variedad mejorada, líneas 
avanzadas de mejoramiento, plantas silvestres) o por su origen (lugar de 
recolección o creación). 


2.6. Descriptor 



Un descriptor es una característica o atributo cuya expresión es fácil de medir, 
registrar o evaluar y que hace referencia a la forma, estructura o comportamiento 
de una accesión. Los descriptores son aplicados en la caracterización y evaluación 
de las accesiones debido a que ayudan a su diferenciación y a expresar el atributo 
de manera precisa y uniforme, lo que simplifica la clasificación, el almacenamiento, 
la recuperación y el uso de los datos. Estos descriptores han sido definidos para un 
gran número de especies cultivadas. El IPGRI ha compilado y publicado en forma 
de manual listados de descriptores para más de 100 especies cultivadas. A 
continuación, se incluyen los diferentes tipos de descriptores cuya definición 
completa aparece en las listas del IPGRI. 

- De pasaporte. Proporcionan la información básica que se utiliza para el 
manejo general de la accesión, incluyendo el registro en el banco de 
germoplasma y cualquier otra información de identificación, y describen los 
parámetros que se deben observar cuando se hace la recolección original. 

- De manejo. Proporcionan las bases para el manejo de las accesiones en el 
banco de germoplasma y ayudan durante su multiplicación y regeneración; 
por ejemplo, fechas de multiplicación, cantidades de semillas disponibles, 
porcentajes de viabilidad. 

- Del sitio y el medio ambiente. Describen los parámetros específicos del 
sitio y del ambiente y ayudan en la interpretación de resultados cuando se 
realizan pruebas de caracterización y evaluación. Se incluyen, también, en 
esta categoría los descriptores del sitio de recolección del germoplasma; por 
ej., coordenadas geográficas, características de clima y suelos. 

- De caracterización. Permiten la discriminación relativamente fácil entre 
fenotipos. Generalmente son caracteres altamente heredables que pueden 
ser fácilmente detectados a simple vista y se expresan igualmente en todos 
los ambientes. Además, pueden incluir un número limitado de caracteres 
adicionales considerados como deseables por consenso de los usuarios de 
un cultivo en particular; por ejemplo, colores y formas de tallos, hojas, flores, 
semillas y frutos. Adicionalmente, en los últimos años se están incluyendo 
descriptores relacionados con los marcadores moleculares, gracias a los 



avances logrados en la biología molecular, especialmente en las técnicas de 
electroforesis. 

- De evaluación. La expresión de la mayoría de los descriptores de esta 
categoría depende del medio ambiente y, en consecuencia, se requieren 
métodos experimentales especiales para su evaluación. La evaluación puede 
también involucrar métodos complejos de caracterización molecular o 
bioquímica. En este tipo de descriptores se incluyen caracteres como 
rendimiento, productividad agronómica, susceptibilidad a estrés y caracteres 
bioquímicos y citológicos, los cuales generalmente son de mayor interés en 
el mejoramiento de cultivos. Para los propósitos de este boletín se dará 
énfasis a los descriptores de caracterización y de evaluación, aunque es 
importante resaltar nuevamente que todos ellos tienen un papel relevante en 
el análisis integral de una colección de germoplasma. 

2.6.1. Estados del descriptor y tipos de datos 

Se espera que las características visibles de una especie sean más o menos 
homogéneas, sin embargo, todas no se expresan con la misma intensidad y algunos 
miembros de la población pueden presentar diferentes grados de expresión que se 
traducen en diferentes tipos de datos o categorías de variables. Por tanto, los 
descriptores se pueden diferenciar de acuerdo con el estado que presentan, lo cual 
es conocido como “estados del descriptor” y se registran mediante escalas de valor. 
Existen distintas categorías de datos, según la expresión del descriptor que puede 
ser en forma cualitativa o cuantitativa (Figura 1). Si se expresa en forma cualitativa, 
se pueden generar datos binarios (también llamados de doble estado), datos con 
secuencia (ordinales) y datos sin secuencia (nominales). Si se expresa en forma 
cuantitativa, los datos generados pueden ser discontinuos (llamados también 
discretos) y continuos. 

Las siguientes sugerencias ayudan en el registro práctico de los datos: 

- Para los datos cualitativos de tipo binario, cada descriptor presenta dos 
estados (presente = 1, ausente = 0). Por ejemplo, presencia de flores blancas 
(1), ausencia de flores blancas (0). 



- Para los datos cuantitativos de tipo ordinal o con secuencia, el descriptor se 
registra utilizando una serie de estados predefinidos; por ejemplo, para altura 
de la planta: 1 = corta (<0.5 m), 3 = intermedia (>0.5 <1.5 m), 5 = alta (>1.5 
m). 

- Para los datos cualitativos de tipo nominal o sin secuencia el descriptor se 
registra usando una serie de estados previamente definidos; por ejemplo, 1 
= blanco, 2 = crema, 3 = amarillo. 

- Para los datos cuantitativos de tipo continuo el descriptor se registra en 
unidades internacionales (SI) estándar, por ejemplo, altura de la planta = 0.9 
m; peso de 100 semillas = 250 g. 

2.7. Análisis clúster 



Figura 1 . Tipos de datos y descriptores 

El análisis clúster es un conjunto de técnicas multivariantes utilizadas para clasificar 
a un conjunto de individuos en grupos homogéneos. 

Pertenece, al igual que otras tipologías y que el análisis discriminante al conjunto 
de técnicas que tiene por objetivo la clasificación de los individuos. La diferencia 
fundamental entre el análisis clúster y el discriminante reside en que en el análisis 



























































ciúster los grupos son desconocidos a priori y son precisamente lo que queremos 
determinar; mientras que, en el análisis discriminante, los grupos son conocidos y 
lo que pretendemos es saber en qué medida las variables disponibles nos 
discriminan esos grupos y nos pueden ayudar a clasificar o asignar los individuos 
en/a los grupos dados. 

Así pues, el objetivo es obtener clasificaciones (clusterings), teniendo, por lo tanto, 
el análisis un marcado carácter exploratorio. 

Se trata, fundamentalmente, de resolver el siguiente problema: Dado un conjunto 
de individuos (de N elementos) caracterizados por la información de n variables Xj, 
(j = 1, 2, ..., n), nos planteamos el reto de ser capaces de clasificarlos de manera 
que los individuos pertenecientes a un grupo (ciúster) (y siempre con respecto a la 
información disponible) sean tan similares entre sí como sea posible, siendo los 
distintos grupos entre ellos tan disimilares como sea posible. 

Como puede comprenderse fácilmente el análisis ciúster tiene una extraordinaria 
importancia en la investigación científica, en cualquier rama del saber. Téngase 
presente que la clasificación es uno de los objetivos fundamentales de la ciencia. Y 
en la medida en que el análisis ciúster nos proporciona los medios técnicos para 
realizarla, se nos hará imprescindible en cualquier investigación. 

Ya desde Linneo, las clasificaciones y taxonomías fueron piezas clave en las 
investigaciones biológicas, y, en consecuencia, no puede resultarnos extraño que 
haya sido en los entornos de este tipo de ciencias donde hayan surgido las técnicas 
del análisis ciúster. Los trabajos de Sokal y Sneath, marcan el inicio de las técnicas 
de clusterización, que, poco a poco, han ido extendiendo sus aplicaciones a todos 
los ámbitos científicos. 

Con el análisis ciúster se pretende encontrar un conjunto de grupos a los que ir 
asignando los distintos individuos por algún criterio de homogeneidad. Por lo tanto, 
se hace imprescindible definir una medida de similitud o bien de divergencia para ir 
clasificando a los individuos en unos u otros grupos. 



Así, debemos plantearnos si vamos a comenzar la agrupación partiendo de algunos 
grupos ya establecidos o si, por el contrario, comenzaremos por considerar cada 
elemento individual como un clúster inicial que posteriormente iremos agrupando 
hasta obtener los clústeres finales: Deberemos plantearnos la posibilidad de 
reasignaciones a lo largo del proceso. Igualmente deberemos establecer criterios 
para detener la agrupación y para llevarla a cabo. 

Básicamente, el análisis constará de un algoritmo de clasificación que nos permitirá 
la obtención de una o vahas particiones, de acuerdo con los criterios establecidos. 

El proceso completo puede estructurarse de acuerdo con el siguiente esquema: 
Partimos de un conjunto de N individuos de los que se dispone de una información 
cifrada por un conjunto de n variables (una matriz de datos de N individuos; n 
variables). 

Establecemos un criterio de similaridad para poder determinar: Una matriz de 
similaridades que nos permita relacionar la semejanza de los individuos entre sí 
(matriz de N individuos x N individuos). 

Escogemos un algoritmo de clasificación para determinar la estructura de 
agrupación de los individuos. 

Especificamos esa estructura mediante diagramas arbóreos o dendogramas u otros 
gráficos. 

Así pues, la clave de una buena clasificación pasará por: 

a) Una buena selección de las variables que nos van a describir a los individuos. 
En este sentido un análisis de datos previo puede ser necesario o 
interesante. La posibilidad de combinar secuencialmente el análisis factorial 
y el análisis clúster, como se hará aquí, puede ser provechosa. 

b) Poner buen cuidado en el criterio de similaridad a utilizar. 

c) Seleccionar adecuadamente el algoritmo de clasificación. 

Así pues, en las siguientes páginas dedicaremos algún espacio a reseñar los 
criterios más importantes de similaridad y los principales métodos de análisis, 



centrándonos en ios algoritmos de clasificación jerárquica ascendente más 
utilizados. 

- Criterios de similitud: Similitud, divergencia y distancia. 

Una vez hemos hecho una adecuada selección de las variables a considerar, cada 
uno de los individuos sujetos al análisis nos vendrá representado por los valores 
que tomen estas variables en cada uno de ellos. Este es el punto de partida de la 
clasificación. Para clasificar adecuadamente los individuos deberemos determinar 
lo similares o disimilares (divergentes) que son entre sí, en función de lo diferentes 
que resulten ser sus representaciones en el espacio de las variables. 

Para medir lo similares (o disimilares) que son los individuos existe una enorme 
cantidad de índices de similaridad y de disimilaridad o divergencia. Todos ellos 
tienen propiedades y utilidades distintas y habrá que ser consciente de ellas para 
su correcta aplicación al caso que nos ocupe. 

La mayor parte de estos índices serán o bien, indicadores basados en la 
distancia (considerando a los individuos como vectores en el espacio de las 
variables) (en este sentido un elevado valor de la distancia entre dos individuos nos 
indicará un alto grado de disimilaridad entre ellos); o bien, indicadores basados en 
coeficientes de correlación; o bien basados en tablas de datos de posesión o no de 
una serie de atributos. 

- Criterios basados en distancias como indicadores de disimilaridad 

Se da, en general, el nombre de distancia o disimilaridad entre dos individuos i y j a 
una medida, indicada por d(i,j) , que mide el grado de semejanza, o a mejor decir 
de desemejanza, entre ambos objetos o individuos, en relación a un cierto número 
de características cuantitativa y / o cualitativas. El valor de d(i,j) es siempre un valor 
no negativo, y cuanto mayor sea este valor mayor será la diferencia entre los 
individuos j e i. 



3. MATERIALES Y MÉTODOS 

3.1. Base de datos para post análisis estadístico 


Tabla N°-1. Medida de los 100 datos (longitud de hojas). Salvia leucantha 


LONGITUD DE HOJAS (cm) 

10.51 

10.80 

11.25 

12.20 

13.56 

10.51 

10.76 

11.22 

12.14 

13.52 

10.51 

10.75 

11.13 

11.90 

12.78 

10.50 

10.75 

11.12 

11.83 

12.52 

10.47 

10.67 

11.10 

11.78 

12.40 

10.60 

11.02 

11.57 

12.32 

12.35 

10.57 

11.02 

11.42 

12.32 

11.74 

10.57 

10.98 

11.32 

12.30 

11.04 

10.55 

10.83 

11.30 

12.22 

10.64 

9.07 

9.43 

9.79 

10.08 

10.46 

9.10 

9.44 

9.81 

10.08 

10.46 

9.02 

9.31 

9.67 

10.07 

10.42 








DESCRIPTORES CUALITATIVOS 


3.2. Base de datos para descriptores de 5 géneros de la familia Lamiaceae 

3.2.1. Descriptores de caracteres cualitativos 

Tabla 2. Descriptores cualitativos para la familia Lamiaceae. 



DESCRIPTOR 

TIPO 

CODIGO 



VERDE OSCURO 

GRISACEO 

1 

T—1 


VERDE OSCURO 

2 

cc 

<c 

COLOR DE HOJA 

VERDE 


> 


GRISACEO 

3 



VERDE CLARO 

BRILLANTE 

4 

CCT 

<C cvj 

> 

TALLO 

CON 

1 

PUBESCENTE 

SIN 

2 

co 

FORMA DEL 

ÁPICE 

AGUDO 

1 

cc 

<c 

CUSPI DADO 

2 

> 

REDONDEADA 

3 



ORBICULAR 

1 


FORMA DE LA 

HOJA 

LANCEOLADA 

2 

cc 

<C 

OVADA 

3 

> 

ELIPTICA 

4 



CORDADA 

5 


COLOR DE 

ROJ ISO 

1 

LO 

Qd 

TALLO O DE LOS 

VERDE 

2 

<c 

> 

BROTES 

ROJO VIOLACEO 

3 


PEQUEÑOS 

V tKUt- 

4 



ASERRADO 

1 

LO 

cc 

MARGEN DE 

ASERRULADO 

2 

<c 

> 

HOJA 

CRENADO 

3 



LACERADO 

4 

cc 

VENACIÓN HOJA 

PINNADA 

1 

> 

RETI CU LA DA 

2 

oc: 

<C oo 
> 

DISPOCICIÓN 

MONOPODICA 

1 


SI MPODICA 

2 



OBTUSA 

1 

cr> 

FORMA BASE DE 

HOJA 

REDONDEADA 

2 

cc 

<C 

CORDADA 

3 

> 

DESIGUAL 

4 



ATENUADA 

5 



ESPIGA 

1 

CZ3 


RACIMO 

2 


INFLORESCENCIA 

CORIMBO 

3 

> 


VERTICI LASTRO 

4 



CIMOSA 
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Tabla 3. Descriptores cuantitativos para la familia Lamiaceae. 



DESCRIPTOR 

UNI DAD SI 

LO 

O 

VAR 11 

ANCHO DE HOJA 

mm 

> 

i— 

VAR 12 

CANTIDAD DE NERVIOS 


< 

i— 

VAR 13 

ALTURA 

cm 

i— 

-z. 

VAR 14 

LARGO DE LA HOJA 

mm 

<L 

ID 

O 

LO 

LU 

VAR 15 

NUMERO DE TALLOS 


VAR 16 

DIAMETRO DE ENTRENUDOS 

mm 

cu 

O 

VAR 17 

NUMERO DE ENTRENUDOS 


1- 

Q_ 

VAR 18 

LONGITUD DE NERVIO 

mm 

O 

LO 

VAR 19 

ANCHO PECIOLO 

mm 

LU 

O 

VAR 20 

LARGO PECIOLO 

mm 


3.2.2. Organización de los datos, matriz básica de datos 

La matriz básica de datos construimos a partir de la información obtenida en la 
caracterización y evaluación de especies. Consiste en un arreglo en forma de 
cuadrícula con tantas filas como accesiones existentes y una columna para cada 
variable (VAR). 



































Tabla 4. Matriz de datos cualitativos. 


GENERO 

ACCESIÓN 

VARIABLE CUALITATIVA 

VARI 

VAR2 

VAR3 

VAR4 

VAR5 

VAR6 

VAR7 

VAR8 

VAR9 

VARIO 

SALVIA 

LEUCANTHA 

GENERO 1 

1 

1 

2 

2 

4 

2 

2 

1 

4 

2 

GENERO 1 

1 

1 

2 

2 

4 

2 

2 

1 

4 

2 

GENERO 1 

1 

1 

2 

2 

4 

2 

2 

1 

4 

2 

GENERO 1 

1 

1 

2 

2 

4 

2 

2 

1 

4 

2 

GENERO 1 

1 

1 

2 

2 

4 

2 

2 

1 

4 

2 

PROMEDIO 

1 

1 

2 

2 

4 

2 

2 

1 

4 

2 

ORIGANUM 

VULGARE 

GENERO 2 

3 

2 

3 

1 

2 

4 

1 

2 

5 

3 

GENRRO 2 

3 

2 

3 

1 

2 

4 

1 

2 

5 

3 

GENERO 2 

3 

2 

3 

1 

2 

4 

1 

2 

5 

3 

GENERO 2 

3 

2 

3 

1 

2 

4 

1 

2 

5 

3 

GENERO 2 

3 

2 

3 

1 

2 

4 

1 

2 

5 

3 

PROMEDIO 

3 

2 

3 

1 

2 

4 

1 

2 

5 

3 

MELISSA 

OFFICIN ALIS 

GENERO 3 

4 

2 

1 

3 

2 

3 

2 

2 

3 

4 

GENERO 3 

4 

2 

1 

3 

2 

3 

2 

2 

3 

4 

GENERO 3 

4 

2 

1 

3 

2 

3 

2 

2 

3 

4 

GENERO 3 

4 

2 

1 

3 

2 

3 

2 

2 

3 

4 

GENERO 3 

4 

2 

1 

3 

2 

3 

2 

2 

3 

4 

PROMEDIO 

4 

2 

1 

3 

2 

3 

2 

2 

3 

4 

MENTHA SPICATA 

GENERO 4 

2 

2 

1 

4 

1 

1 

1 

2 

2 

1 

GENERO 4 

2 

2 

1 

4 

1 

1 

1 

2 

2 

1 

GENERO 4 

2 

2 

1 

4 

1 

1 

1 

2 

2 

1 

GENERO 4 

2 

2 

1 

4 

1 

1 

1 

2 

2 

1 

GENERO 4 

2 

2 

1 

4 

1 

1 

1 

2 

2 

1 

PROMEDIO 

2 

2 

1 

4 

1 

1 

1 

2 

2 

1 

M 1 NTHOSTACHYS 

MOLLIS 

GENEROS 

3 

1 

1 

5 

3 

1 

2 

2 

4 

5 

GENERO 5 

3 

1 

1 

5 

3 

1 

2 

2 

1 

5 

GENERO 5 

3 

1 

1 

5 

3 

1 

2 

2 

4 

5 

GENEROS 

3 

1 

1 

5 

3 

1 

2 

2 

1 

5 

GENERO 5 

3 

1 

1 

5 

3 

1 

2 

2 

1 

5 

PROMEDIO 

3 

1 

1 

5 

3 

1 

2 

2 

1 

5 













































MENTHA SPICATA 


Tabla 4. Matriz de datos cuantitativos 


GENERO 


UJ 


Sí 
< -9 

t/i < 
i/l 2 


U 


i/l 

> 

I 

u 

É 

/I 

0 

1 
h 

2 


ACCESIÓN 

VARIABLE CUANTITATIVA 

VAR11 

VAR12 

VAR13 

VAR14 

VAR15 

VAR16 

CVAR17 

VAR18 

VAR19 

VAR20 

GENERO 1 

15.9 

18 

115 

137.9 

15 

5.3 

20 

90.7 

2.3 

10.9 

GENERO 1 

16.3 

18 

118 

135.5 

12 

5,6 

22 

121.3 

2.3 

14.1 

GENERO 1 

15.5 

20 

116 

124.8 

18 

5.9 

20 

78.7 

2.5 

9.2 

GENERO 1 

19.4 

18 

117 

112.8 

12 

5.2 

20 

100.3 

2.2 

12.3 

GENERO 1 

16.5 

19 

119 

142.4 

8 

4.9 

18 

110.6 

2.3 

10.3 

\MMM 

16.7 

18.6 

117 

1307 

13 

5.3 

20 

100.3 

2.3 

11.4 

GENERO 2 

12.1 

5 

65 

307 


1.7 

12 

15.3 

0.6 

4.8 

GENRR02 

8.8 

4 

78 

23.1 

25 

1.9 

15 

21.5 

0.5 

9.9 

GENERO 2 

10.1 

5 

52 

22.4 

36 

2.8 

13 

17.6 

0.6 

6.9 

GENERO 2 

11.4 

3 

76 

24.3 

30 

2.4 

12 

15.1 

1.1 

7.6 

GENERO 2 

9.1 

4 


27.2 

22 

1.7 

14 

19.5 

0.7 

9.4 

IMM1J 

10.3 

4.2 

67.8 

25.5 

30.6 

2.1 

13.2 

17.8 

0.7 

7.7 

GENERO 3 

18.4 

5 

42 

27.6 

12 

2.1 

15 

25.6 

0.5 

8.7 

GENERO 3 

16.8 

5 

43 

42.6 

18 

1.8 

16 

22.1 

0.6 

7.3 

GENERO 3 

22.2. 

4 

35 

29.5 

15 

2.2. 

14 

19.6 

0.8 

7.9 

GENERO 3 

17.9 

5 

55 

35.1 

18 

1.6 

15 

22.5 

0.8 

8.4 

GENERO 3 

16.6 

5 

32 

32.6 

14 

1.8 

12 

24.8 

0.7 

6.8 

IMWM 

17.4 

4.8 

41.4 

33.5 

15.4 

1.8 

14.4 

22.9 

0.7 

7.8 

GENERO 4 

9.8 

7 

36 

32.4 

25 

2.3 

26 

27.3 

1.1 

3.6 

GENERO 4 

12.8 

6 

42 

33.3 

18 

3.1 

29 

24.1 

0.9 

3.8 

GENERO 4 


8 

35 

27.2 

20 

2.6 

27 

28.9 

1.1 

2.8 

GENERO 4 


9 


28.5 

15 

2.2 

26 

24.3 

0.7 

2.9 

GENERO 4 

12.5 

7 

35 

34.6 

12 

2.8 

28 

25.3 

0.8 

3.9 


12.8 

7.4 

37.6 

31.2 

18 

2.6 

27.2 

26 

0.9 

3.4 

GENERO 5 

21.6 

8 

124 

59.7 

5 

8.3 

30 

35.8 

2.1 

10.9 

GENERO 5 

29.8 

9 

115 

65.6 

7 

8 

35 

48.3 

1.6 

10.2 

GENERO 5 

27.6 

8 

116 

58.1 

8 

7.4 

28 

43.4 

1.4 

11.1 

GENERO 5 

32.4 

8 

118 

61.8 

6 

7.8 

25 

49.4 

1.2 

12.2 

GENERO 5 

31.2 

7 

118 

57.4 

4 

7.8 

29 

43.1 

1.9 

11.2 

liiiSiUd 

28.5 

8 

118.2 

605 

6 

7.9 

29.4 

44 

1.6 

11.1 




















































































































































Tabla 5. Matriz de datos cuantitativo y cualitativo 














































































































































































































































































4. RESULTADOS Y DISCUSIÓN 
4.1. Análisis Estadístico 

A) PROMEDIO, VARIANZA Y DESVIACION ESTANDAR 

- De esta tabla obtenemos el promedio con la función PROMEDIO en la hoja 
de cálculo, dicho resultado es: 


x - 10.37 

Esto nos indica que las longitudes, el 50 % son menores que 10.37 y el otro 50 % 
son mayores que 10.37. 

- De la misma tabla obtenemos la varianza con la función para calcular la 
VARIANZA MUESTRAL, dando como resultado el siguiente 

S 2 = 1.48 

Esto nos indica que cada muestra tiene una variabilidad o diferencia longitudinal de 
aproximadamente 1.48 

- A continuación, obtenemos la desviación estándar sacando la raíz cuadrada 
a la varianza, dando como resultado lo siguiente. 

S = 1.22 

Podemos señalar de este dato que, 1.22 es el grado de separación o dispersión de 
cada uno de nuestros datos. 

B) TABLA DE DISTRIBUCIÓN DE FRECUENCIAS 

Tabla 6. Tabla de distribución de frecuencias. 


INTERVALOS 

Xi 

Fi 

Fi 

fr 

Fr 

fr% 

6.64 

7.51 

7.08 

1 

1 

0.01 

0.01 

1 

7.51 

8.38 

7.94 

2 

3 

0.02 

0.03 

2 




8.38 

9.24 

8.81 

14 

17 

0.14 

0.17 

14 

9.24 

10.11 

9.67 

27 

44 

0.27 

0.44 

27 

10.11 

10.97 

10.54 

27 

71 

0.27 

0.71 

27 

10.97 

11.84 

11.40 

16 

87 

0.16 

0.87 

16 

11.84 

12.70 

12.27 

10 

97 

0.1 

0.97 

10 

12.70 

13.57 

13.13 

3 

100 

0.03 

1 

3 




100 


1 


100 % 


C) INTERPRETACIÓN FRECUENCIAS 

- Xi, es el punto medio de cada clase o intervalo. Por ejemplo: 

XI =7.08, este dato, es el punto medio del intervalo 6.64-7.51 

- fi, nos indica la cantidad de datos maestrales se encuentran en cada clase, 
la suma del total de nos resulta la cantidad de datos. Por ejemplo: 

fl =1 existe solo un dato en el intervalo 6.64-7.51 

- Fi, nos indica la cantidad de datos menores que el intervalo mayor de cada 
clase. Por ejemplo: 

F3= Nos indica que existen 17 datos menores que 9.24 

- fr, Nos indica la cantidad porcentual en cada clase. Por ejemplo: 
fr2=2% Existe un 2% de datos entre el intervalo 7.51 -8.38 


Fr, nos indica la cantidad porcentual, menores que el intervalo mayor. Por 
ejemplo: 




Fr5= 71% el 71 % de los datos son menores que 10.97 


D) HISTOGRAMA DE FRECUENCIAS, ABSOLUTA ACUMULADA 

GRAFICO DE HISTOGRAMA, FRECUENCIA 
ABSOLUTA VS INTERVALOS 

mm \ 

INTERVALOS 

■ 6.64-7.51 17.51-8.38 18.38-9.24 19.24-I0.il 

■ 10.11 -10.97 1 10.97 -11.84 ■ 11.84 -12.70 ■ 12.70 -13.57 

Gráfico 1. Este gráfico nos indica la proporción que existe, cada frecuencia respecto 
de cada intervalo, la elevación de cada cuadro con su respectivo color nos da a 
conocer cuántos datos existe, el más corto es obviamente el que presenta menor 
frecuencia, el de mayor elevación, mayor cantidad de datos en cierto intervalo. 




HISTOGRAMA DE FRECUENCIAS, ACUMULADA VS INTERVALOS 

120.00 



INTERVALOS 


■ 6.64-7.51 17.51-8.38 «8.38-9.24 19.24-10.11 110.11-10.97 110.97-11.84 111.84-12.70 112.70-13.57 

Gráfico 2. Este gráfico nos indica la proporción que existe entre el intervalo y la 
frecuencia acumulada, en este caso la proporción es gradual, y la gráfica o 
distribución de las barras es en forma de escalera, puesto que el dato de cada 
frecuencia es menor al mayor intervalo. 



E) Gráfica de distribución normal 


DISTRIBUCION NORMAL POR CADA DATO 
MUESTRAL 

0.35 
< 0.30 

O 0 25 

2 

2 0.20 

O 

U 0.15 

D 
CO 

5 0.10 

H 

- 0.05 

O 

0.00 

2.00 4.00 6.00 8.00 10.00 12.00 14.00 16.00 

LONGITUD DE HOJAS 
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Gráfico 3. Este gráfico nos da a conocer la distribución de los datos de nuestra 
muestra. Teniendo como media teniendo como media p=10.37 y s=1.22. 

F) PROBLEMAS DE PROBABILIDADES 

a) calcular la probabilidad de que la longitud de una hoja sea mayor a 12. 





Pipe > 12) = 0.091 


Tenemos como resultado una probabilidad mínima de 0.091 

b) Clcular la probabilidad de que una hoja tenga la longitud mayor a 11.59. 


j»** - 

/\ 



(5.71 7<?3 SM5 10.3 7 11.5^ L2.S1 


P(x > 11.59) = 0.159 


La probabilidad de encontrar una hoja mayor a dicha longitud es 0.159. 



c) Calcular la probabilidad que la longitud de una hoja sea mayor o igual a 6.71 
pero menor o igual que 9.15. 



P(6.71 < x < 9.15) = 0.157 

La probabilidad de que la hoja tenga dicha medida es 0.157 

d) Calcular la probabilidad de que una hoja tenga una longitud mayor a 8. 





P(X > 8) = 0.974 


La probabilidad de que, la longitud sea mayor a 8 es 0.974. 

e) Calcular la probabilidad de que, la longitud de una hoja sea menor o igual 
que 9 y mayor o igual que 11 



6.71 7 . 9-3 9.15 10.37 11.59 12.31 


P(X < 9) y P(X > 11) = 0.434 


La probabilidad de una longitud menor que 9 y mayor que 11 es 0.434. 



f) Calcular la probabilidad de que una longitud sea menor que 11.80. 



6.71 7.P3 P.15 10.37 11.59 12.81 


P{x < 10.80) = 0.638 

La probabilidad de una longitud menor a 10.80 es 0.638. 

g) Calcular la probabilidad de que una hoja tenga una longitud menor que 7.93 
y mayor a 13. 



P(x < 7.93) y P(x > 13) = 0.038 




La probabilidad de que, una hoja mide menos de 7.93 y más de 13 es 0.038. 

4.2. CARACTERIZACION MORFOLÓGICA 

Dicho análisis está basado en calcular dominancia o promedio de cada variable o 
descriptor (en una hoja de cálculo, el proceso de análisis de datos será analizado 
para luego evaluar en IBM, y obtener nuestro dendrograma de similitud de especies 
o grupos. 

Tabla 7. Promedios y/o dominancia que presentan las variables o características 
por cada género de la familia Lamiaceae. 
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cü 

111 

0 

< 

l 

cc 

0 

n 

< 

ü 

z 

111 

u 

1/1 

111 

a. 

0 

J 

u. 

z 

? 

E 

< 

-i 

0 

i 

0 

I 

u 

z 

< 

ni 

0 

i/l 

LU 

CC 

< 

0. 

0 

< 

0 

h 

z 

< 

? 

u 

< 

a. 

D 

h 

j 

< 

t 

< 

-i 

0 

i 

í 

u 

ü 

0 

15 

cc 

í 

[\J LJ l\/l ERO DE TALLOS 

D 

Z 

LÜ 
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¡5 

Z 

0 

J 

c 

E 

0 

j 

0 

u 
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0 

I 

u 

z 

< 

LARGO PECIOLO (mm 

Salvia leucantha 

1 

i 

2 

2 

4 

2 

2 

1 

4 

D 

167 

18,6 

1170 

130,7 

13,0 

5,3 

20,0 

100,3 

2,3 

11,4 

Origanum vulgare 

3 

D 

D 

■ 

□ 

D 

D 

D 

D 

B 

10,3 

4,2 

67,8 

25,5 

30,6 

2,1 

13,2 

17,8 

0,7 

7,7 


D 


■ 

D 


D 

□ 

□ 

D 

4 

174 

4,8 

41,4 

33,5 

15,4 

1,8 

14,4 

22,9 

0,7 

7,8 

Menthaspicata 

2 

D 

■ 

D 

■ 

■ 

D 

H 

D 

1 

128 

7,4 

37,6 

31,2 

18,0 

2,6 

27,2 



3,4 

Minthostachys mollis 

3 

D 

■ 

n 

O 

■ 

D 

H 

D 

5 

285 

8,0 

118,2 

60,5 

60 

7,9 

29,4 

44,0 

1,6 

11,1 


4.3. Dendrograma de análisis de similaridad 


Este procedimiento fue realizado a través de un análisis clúster, principalmente, nos 
muestra el agrupamiento de dichas especies y/o géneros de la familia Lamiaceae, 
en el IBM SPSS, tenemos la facilidad de procesar los datos de muestre o de 
caracterización que propiamente analizada por el software, nos arroja un 
dendrograma de similaridad muy excéntrico y objetivo (figura 2). 





























Figura 2. Dendrograma de similitud de 5 géneros y/o especies de la Famila 
Lamiacee 


Dendrograma de similaridad de 5 géneros de la familia Lamiaceae 

Combinación de clúster de distancia re-escalada 

0 5 10 15 20 25 

Melissa officinalis 3 


Mentha spicata 4 


>■ Origanum vulgare 2 


Minthostachys mollis 5 


Salvia leucantha 1 



Gráfico 4. El análisis cluster nos muestra cuanto más precisa y alargada es el 
análisis, la diferencia de caracteres que presenta cada cuerpo del grupo o familia 
es más peculiar, en este caso, las especies acarrean un parecido no solo a la familia 
a la que pertenecen sino a la tribu que asemejan que vendría a ser la tribu 
Mentheae. 

A una distancia más alargada de 0 unidades, las 5 especies, cada una de un género 




representativo de la familia Lamiaceae, muestra des-similitudes, que los hace 
especies más peculiares y auténticas, que las hace únicas naturalmente y nuestro 
análisis clúster nos muestra un análisis con 5 grupos distintos. 

A la unidad mínima de distancia (1), Melissa officinalis Y Mentha spicata obedecen 
una similaridad propia, esto las hace especies parecidas, ya que ambos, poseen 
muchas características similares, entre ellas, no poseen tallo pubescente, hojas 
parecidas, altura de planta, disposición de las ramas, entre otras el análisis clúster 
clasifica la familia en cuatro grupos. 

A una distancia próxima de 2, nos muestra que Melissa officinalis, Mentha Spicata 
y Origanum vulgare, alcanzan una similitud más propia, esto obedece a los 
caracteres o descriptores propios de las tres especies, entre ellas destaca la 
cantidad de tallos arbustivos que presentan, así mismo la no presencia de 
pubescencia en los tallos, la disposición de las ramas que presentan todas, y nustro 
análisis clúster nos muestra tres grupos distintos. 

A una distancia de 7 unidades, Melissa officinalis, Mentha spicata, Origanum vulgare 
y Minthostachys mollis alcanzan mayor similitud, esto obedece a que se presenten 
2 grupos distintos de, en el cual Salvia leucantha es la especie más peculiar y única, 
logrando alcanzar una des-similitud de las otras especies, salvia en particular, 
presenta, forma distinta de hoja, altura y sobre todo el tallo pubescente que 
presenta, pero, por la tribu al que pertenece adjunta esa característica con las 
demás especies y también presenta una inflorescencia muy particular. 

5. CONCLUSIÓN 

Se evaluaron 100 hojas de Salvia leucantha, obteniendo un promedio de 10.37, 
varianza 1.48 y desviación estándar de 1.22, esto nos indica que hay una 
diferenciación en esta variable cualitativa de aproximadamente 1.48. 

Si bien es cierto, la caracterización morfológica fitogenética de esta familia, nos da 

a conocer la variabilidad fenotípica que presenta, por ello radica la importancia de 

conocer los caracteres o descriptores, que nos permitan distinguir los grupos 



taxonómicos que conocemos, así mismo nos abre una brecha de conocer especies 
y diferenciarlas de la misma forma unas con otras. 

En el dendrograma de variables, nos muestra la similitud que existe entre las 
especies, pero esta a su vez, al aumentar el análisis o la distancia de evaluación 
nos propone que las especies se aíslan unas de las otras por su peculiaridad y 
autenticidad. 
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